亚马逊云科技 _机器学习领域信息情报检索---XiaoMi-AI

2024年7月23日 16:18

AWS AI 芯片为 AWS 上的 Llama 3.1 模型提供高性能和低成本

AWS AI chips deliver high performance and low cost for Llama 3.1 models on AWS

今天，我们很高兴地宣布 AWS Trainium 和 AWS Inferentia 支持 Llama 3.1 模型的微调和推理。Llama 3.1 系列多语言大型语言模型 (LLM) 是一组预先训练和指令调整的生成模型，大小分别为 8B、70B 和 405B。在上一篇文章中，我们介绍了如何在 Amazon SageMaker JumpStart 中基于 AWS Trainium 和 Inferentia 的实例上部署 Llama 3 模型。在这篇文章中，我们概述了如何开始在 AWS AI 芯片上微调和部署 Llama 3.1 系列模型，以实现其性价比优势。

2024年7月23日 16:16

Llama 3.1 模型现已在 Amazon SageMaker JumpStart 中可用

Llama 3.1 models are now available in Amazon SageMaker JumpStart

今天，我们很高兴地宣布，最先进的 Llama 3.1 多语言大型语言模型 (LLM) 集合（包括 8B、70B 和 405B 大小的预训练和指令调整生成式 AI 模型）可通过 Amazon SageMaker JumpStart 部署以进行推理。Llama 是一种可公开访问的 LLM，专为开发人员、研究人员和企业设计，用于构建、试验和负责任地扩展他们的生成式人工智能 (AI) 创意。在这篇文章中，我们将介绍如何使用 SageMaker JumpStart 发现和部署 Llama 3.1 模型。

2024年7月17日 16:58

德勤意大利如何使用量子机器学习和 Amazon Braket 构建数字支付欺诈检测解决方案

How Deloitte Italy built a digital payments fraud detection solution using quantum machine learning and Amazon Braket

随着数字商务的扩展，欺诈检测已成为保护参与在线交易的企业和消费者的关键。实施机器学习 (ML) 算法可以实时分析大量交易数据，以快速识别欺诈活动。这种先进的功能有助于降低金融风险并在不断扩展的数字市场中保护客户隐私。德勤是一家全球战略 […]

2024年7月17日 16:49

Amazon SageMaker 推出 Cohere Command R 微调模型

Amazon SageMaker unveils the Cohere Command R fine-tuning model

AWS 宣布在 Amazon SageMaker 上推出 Cohere Command R 微调模型。SageMaker 机器学习 (ML) 功能套件的最新成员使企业能够利用大型语言模型 (LLM) 的强大功能，并充分发挥其在各种应用中的潜力。Cohere Command R 是一种可扩展的前沿 […]

2024年7月17日 16:36

使用 Amazon Q Business 从 AWS 获得有意义且可操作的运营见解

Derive meaningful and actionable operational insights from AWS Using Amazon Q Business

作为客户，您依赖 Amazon Web Services (AWS) 的专业知识来随时待命并了解您的特定环境和运营。今天，您可能会实施手动流程来总结经验教训、获得建议或加快事件的解决。这可能很耗时、不一致且不易访问。这篇文章展示了如何 [...]

2024年7月16日 19:56

使用 Amazon EKS 上的 NVIDIA NeMo 框架加速您的生成式 AI 分布式训练工作负载

Accelerate your generative AI distributed training workloads with the NVIDIA NeMo Framework on Amazon EKS

在当今快速发展的人工智能 (AI) 领域，训练大型语言模型 (LLM) 带来了重大挑战。这些模型通常需要大量的计算资源和复杂的基础设施来处理所涉及的大量数据和复杂算法。如果没有结构化的框架，这个过程可能会变得非常耗时、昂贵和复杂。企业在管理方面苦苦挣扎 […]

2024年7月16日 17:18

大规模管理 ML 生命周期，第 2 部分：多账户基础

Governing the ML lifecycle at scale, Part 2: Multi-account foundations

您的多账户策略是 AWS 上基础环境的核心。围绕多账户环境的设计决策对于大规模安全运营至关重要。将您的工作负载战略性地分组到多个 AWS 账户中，使您能够跨工作负载应用不同的控制、跟踪成本和使用情况、减少账户限制的影响并降低复杂性 […]

2024年7月15日 17:00

使用 Amazon Translate、Amazon Bedrock 和 Amazon Polly 进行视频自动配音

Video auto-dubbing using Amazon Translate, Amazon Bedrock, and Amazon Polly

这篇文章由 MagellanTV 和 Mission Cloud 共同撰写。视频配音或内容本地化是在同步音频和视频的同时用另一种语言替换视频中原始口语的过程。视频配音已成为打破语言障碍、增强观众参与度和扩大市场覆盖范围的重要工具。然而，[…]

2024年7月15日 16:49

Mixbook 如何使用生成式 AI 提供个性化的照片书体验

How Mixbook used generative AI to offer personalized photo book experiences

几年前，Mixbook 采取了一项战略举措，将其运营工作负载转移到 Amazon Web Services (AWS)，此举不断带来显著优势。这一关键决定在推动他们完成使命方面发挥了重要作用，确保他们的系统操作具有可靠性、卓越性能和运营效率。在这篇文章中，我们将向您展示 Mixbook 如何使用 AWS 中的生成人工智能 (AI) 功能来个性化他们的相册体验——这是他们实现使命的一步。

2024年7月11日 15:52

BRIA AI 如何使用 Amazon SageMaker 中的分布式训练来训练潜在扩散基础模型以供商业使用

How BRIA AI used distributed training in Amazon SageMaker to train latent diffusion foundation models for commercial use

这篇文章是与 BRIA AI 的 Bar Fingerman 共同撰写的。这篇文章解释了 BRIA AI 如何快速且经济地在包含 PB 级许可图像的数据集上训练高分辨率 (1024×1024) 文本到图像传播模型 BRIA AI 2.0。Amazon SageMaker 训练作业和 Amazon SageMaker 分布式训练库承担了与基础设施相关的无差别繁重工作 [...]

2024年7月11日 00:49

Amazon Bedrock 的知识库现在支持高级解析、分块和查询重构，从而更好地控制基于 RAG 的应用程序的准确性

Knowledge Bases for Amazon Bedrock now supports advanced parsing, chunking, and query reformulation giving greater control of accuracy in RAG based applications

Amazon Bedrock 的知识库是一项完全托管的服务，可帮助您实施从提取到检索和快速增强的整个检索增强生成 (RAG) 工作流，而无需构建自定义数据源集成和管理数据流，从而突破了您在 RAG 工作流中可以做的事情的界限。然而，它是 [...]

2024年7月10日 16:45

使用 Prompt Management 和 Prompt Flows（预览版）简化 Amazon Bedrock 中的生成式 AI 开发

Streamline generative AI development in Amazon Bedrock with Prompt Management and Prompt Flows (preview)

今天，我们很高兴推出 Amazon Bedrock 的两个强大新功能：Prompt Management 和 Prompt Flows，公开预览版。这些功能旨在加速生成式人工智能 (AI) 应用程序的开发、测试和部署，使开发人员和业务用户能够创建更高效、更有效且更易于维护的解决方案。您 [...]

2024年7月10日 16:38

使用 GenAI 让每个人都能快速构建、自定义和部署应用程序：AWS 纽约峰会精彩内容

Empowering everyone with GenAI to rapidly build, customize, and deploy apps securely: Highlights from the AWS New York Summit

想象一下——所有员工都依靠生成式人工智能 (AI) 来更快地完成工作，每项任务都变得不那么平凡，更具创新性，每个应用程序都提供更实用、更个性化、更引人入胜的体验。为了实现这一未来，组织需要的不仅仅是一个强大的大型语言模型 (LLM) 或聊天助手。他们需要一个 [...]

2024年7月10日 16:37

我们对安全、负责任的生成式 AI 的承诺进展更新

A progress update on our commitment to safe, responsible generative AI

负责任的 AI 是亚马逊的一项长期承诺。从一开始，我们就将安全性、公平性、稳健性和隐私性嵌入到我们的开发流程中并教育我们的员工，从而优先考虑负责任的 AI 创新。我们努力改善客户的生活，同时建立和实施必要的保障措施来保护他们。我们实用的 […]

2024年7月9日 21:59

使用新的推理优化工具包，在 Amazon SageMaker 上实现高达约 2 倍的吞吐量，同时将成本降低约 50% - 第 2 部分

Achieve up to ~2x higher throughput while reducing costs by up to ~50% for generative AI inference on Amazon SageMaker with the new inference optimization toolkit – Part 2

随着生成式人工智能 (AI) 推理对企业越来越重要，客户正在寻求扩展其生成式 AI 操作或将生成式 AI 模型集成到现有工作流程中的方法。模型优化已成为一个关键步骤，使组织能够平衡成本效益和响应能力，从而提高生产力。但是，性价比要求在不同用例之间差异很大。对于 [...]

2024年7月9日 21:59

使用新的推理优化工具包，在 Amazon SageMaker 上实现高达约 2 倍的吞吐量，同时将成本降低约 50% - 第 1 部分

Achieve up to ~2x higher throughput while reducing costs by ~50% for generative AI inference on Amazon SageMaker with the new inference optimization toolkit – Part 1

今天，Amazon SageMaker 宣布了一款新的推理优化工具包，可帮助您将优化生成式人工智能 (AI) 模型所需的时间从数月缩短到数小时，从而为您的用例实现一流的性能。借助这项新功能，您可以从优化技术菜单中进行选择，将它们应用于您的生成式 AI [...]

2024年7月9日 20:09

Anthropic Claude 3.5 Sonnet 在 Kensho 的 S&P AI 基准测试中，在商业和金融领域排名第一

Anthropic’s Claude 3.5 Sonnet ranks number 1 for business and finance in S&P AI Benchmarks by Kensho

Anthropic Claude 3.5 Sonnet 目前在 Kensho 的 S&P AI 基准中名列前茅，该基准评估了金融和商业的大型语言模型 (LLM)。Kensho 是 S&P Global 的 AI 创新中心。借助 Amazon Bedrock，Kensho 能够快速运行 Anthropic Claude 3.5 Sonnet 以应对一系列具有挑战性的业务和财务挑战 […]

2024年7月8日 19:12

The Weather Company 使用 Amazon SageMaker、AWS CloudFormation 和 Amazon CloudWatch 增强 MLOps

The Weather Company enhances MLOps with Amazon SageMaker, AWS CloudFormation, and Amazon CloudWatch

在本文中，我们分享了 The Weather Company (TWCo) 如何使用 Amazon SageMaker、AWS CloudFormation 和 Amazon CloudWatch 等服务增强其 MLOps 平台的故事。TWCo 数据科学家和 ML 工程师利用自动化、详细的实验跟踪、集成训练和部署管道来帮助有效扩展 MLOps。TWCo 将基础设施管理时间缩短了 90%，同时还将模型部署时间缩短了 20%。